home *** CD-ROM | disk | FTP | other *** search
/ Collection of Internet / Collection of Internet.iso / infosrvr / dev / www_talk.930 / 001167_rik@daneel.rdt.monash.edu.au _Fri May 21 02:17:49 1993.msg < prev    next >
Internet Message Format  |  1994-01-24  |  4KB

  1. Return-Path: <rik@daneel.rdt.monash.edu.au>
  2. Received: from dxmint.cern.ch by  nxoc01.cern.ch  (NeXT-1.0 (From Sendmail 5.52)/NeXT-2.0)
  3.     id AA00422; Fri, 21 May 93 02:17:49 MET DST
  4. Received: from daneel.rdt.monash.edu.au by dxmint.cern.ch (5.65/DEC-Ultrix/4.3)
  5.     id AA11917; Fri, 21 May 1993 02:38:58 +0200
  6. Received: by daneel.rdt.monash.edu.au (5.57/Ultrix3.0-C)
  7.     id AA25269; Fri, 21 May 93 10:38:24 +1000
  8. Message-Id: <9305210038.AA25269@daneel.rdt.monash.edu.au>
  9. To: Marc VanHeyningen <mvanheyn@cs.indiana.edu>
  10. Cc: www-talk@nxoc01.cern.ch
  11. Subject: Re: New service: The Unified CS TR Index 
  12. In-Reply-To: Your message of "20 May 93 13:21:53 EST."
  13.              <454.737922113@moose.cs.indiana.edu> 
  14. Date: Fri, 21 May 93 10:38:22 +1100
  15. From: Rik Harris <rik@daneel.rdt.monash.edu.au>
  16. X-Mts: smtp
  17.  
  18. > WHAT IT IS
  19. > It's pretty simple, really.  A daemon runs and pulls index files from
  20. > many various FTP sites which archive tech reports (and similar
  21. > material.)  At present, 39 FTP sites are included in the index, with
  22. > over 1,400 reports included; both of these numbers are growing rather
  23. > rapidly.  This information is then converted into entries for each
  24. > tech report with hypertext anchors to the TR itself, producing a
  25. > really big file.  This file is then searchable for keywords by a
  26. > Simple Index Keyword Search (SIKS).  I believe it represents a
  27. > potentially nicer general interface to this informational resources
  28. > than existing methods (e.g. WAIS pointers to ftp sites).  It certainly
  29. > is not the ultimate information browsing tool, but I hope it may push
  30. > the migration towards such a little.
  31.  
  32. You might like to check out:
  33.  
  34. http://www.vifp.monash.edu.au/techreports/sitelist.html
  35.  
  36. It is the first run at converting my technical reports archive list
  37. (posted regularly to comp.doc.techreports, news.answers, etc) to html.
  38. It's also available as a WAIS database (cs-techreport-archives).
  39. Ideally, I'd like to maintain it in html, and convert it to text for
  40. posting, but I never seem to get enough time.  It contains about 140
  41. ftp sites that I've collected that appear to archive technical
  42. reports.
  43.  
  44. I also maintain a WAIS database of abstracts from technical reports
  45. (cs-techreport-abstracts).  The format I use is being used now by
  46. several sites, so they can get their data into the database very
  47. quickly (daily automatic checks).  The rest of the abstracts I have
  48. either formatted manually, or written a perl script to convert (where
  49. the conversion looks like it will be useful in the future), with more
  50. and more of a leaning towards writing scripts (who cares if I've got 40
  51. scripts lying around, and never used again?  Besides, I'm a
  52. Perlaholic :-).  For information on the format, see:
  53.  
  54. ftp://daneel.rdt.monash.edu.au/pub/techreports/sites/README
  55.  
  56. and on the whole project in:
  57.  
  58. ftp://daneel.rdt.monash.edu.au/pub/techreports/README
  59.  
  60. The database contains nearly 7000 reports, with over 2000 abstracts
  61. from about 70 universities and research organisations.
  62.  
  63. My grand plan has been to have the entire database searchable,
  64. returning a group of abstracts, with a hypertext link to the paper
  65. itself, or if it's not available via ftp, a "mailto:" that will allow
  66. the "contact" for that paper to be emailed a request for the paper.
  67. This will all be done in W3, I've been converted :-)
  68.  
  69. I can see some common stuff here, so perhaps we could talk about
  70. combining our efforts Marc (in private email, of course).
  71.  
  72. have fun,
  73. rik.
  74. --
  75. Rik Harris - rik.harris@fcit.monash.edu.au
  76. +61 3 560-3265 (AH & ans.mach)      +61 3 565-3227 (BH)
  77. Faculty of Computing and Information Technology,
  78. Clayton Campus, Monash University, Australia